一篇文章搞懂信用评分模型的构建
—、个人信用评分概念
个人信用评分又称“消费者信用评分”,是预测信用申请人或现有借款人违约可能性的一种统计方法。它通过对消费者的人口特征、信用历史记录、行为记录、交易记录等大量历史数据进行系统的分析,利用统计方法及其他定量方法挖掘数据中蕴含的行为模式和信用特征,开发出预测性模型,用以对消费者未来的信用行为进行预测。
有很多信用记录会明显影响个人信用评分,如延迟付款额度变化、拖延付款时间的严重程度、信贷账户数目增减、信贷余额变化、账龄、最近的查询记录等。当个人信用评分模型工作时,它会从个人信用档案中抽取不同因素来评价消费者的信用状态,一旦信用记录中有瑕疵出现,评分模型就会度量出瑕疵的大小,直接从现有的分数中扣除,从而使信用评分的分值减小一些。
信用评分及其自动化的操作加速了整个信贷决策过程,申请人可以更加迅速地得到答复,提高了操作的效率。据美国消费银行协会的最新一份资料,以前不使用信用评分,小额消费信贷的审批平均需要12小时,如今使用信用评分和自动处理程序,这类贷款的审批缩短到15分钟。使用信用分后,60%的汽车贷款的审批可以在1小时内完成。信用卡的审批只要一两分钟,甚至几秒钟。
二、个人信用评分模型构建
“信用评分卡”的概念
在了解个人信用评分模型之前,需要了解“信用评分卡”的概念。在消费者信用评分过程中,信用评分卡是一种表格,由描述借款人状况的各个特征变量的不同取值对应的信用分值所组成。使用信用评分卡可以计算不同借款人的信用评分分值。
建立信用评分模型的过程
个人信用评分模型的建立是市场分析人员、风险管理经理、统计—学家、数据库管理人员和计算机程序员等多个领域的专家综合协调的结果。为了保证个人信用评分模型的顺利开发和应用,必须对建模过程的每个部分进行仔细的设计和计划。
通常,建立信用评分模型的过程一般包括以下几个部分:
1.明确模型的使用目的
建立信用评分模型的目的是预测消费者违约的概率,也可以是预测消费者拖欠的概率,或者是贷款的逾期损失以及拖欠、违约及损失的组合。由于建立模型的目的不同,所研究的对象也不同,在使用开发方法、检验手段和处理原则方面也会存在差异。正是由于上述差异的存在,当一个授信机构使用其他机构的信用审批系统时就需要格外谨慎。
2.数据收集与样本设计
在模型开发过程中,能够收集到用于建立个人信用评分模型的数据是最重要的技术处理环节之一。通常,可供使用的数据越多,模型的预测结果就会越精确。因此,在建立个人信用评分模型之前,需要确定有哪些可以使用的数据。
通常技术人员没有必要也不可能将所有数据都用于建模工作,而是按照一定的方法从中抽取部分合格的样本,利用数据质量优秀样本建立起个人信用评分模型,这样可以达到精确预测的目的。建模工作的这一过程被称为“样本设计”。
3.选择建立信用评分模型的工具
建立个人信用评分模型的统计及数学工具很多,通常使用的方法有判别分析法、逻辑回归、分类树法和神经网络方法等。对于技术人员来说,在选择合适的方法时既要考虑到与建立个人信用评分模型的目的有关,也要考虑到与建模所使用的样本有关。
在实际建立个人信用评分模型时,往往将多种方法交叉使用。例如,可以使用“分类树方法”选择变量,以确定变量之间的相互关系,构造出新的变量。再将这些新变量和原始变量一起使用,通过回归的方法构建出预测模型。然后,把预测模型产生的结果与神经网络模型产生的结果进行比较,以确定模型的有效性,并对模型进行改进。
4.模型的验证与检验
建立了个人信用评分模型(或信用评分卡)后,技术人员面临的一个重要的问题是这一模型的应用效果究竟如何。在模型投入实际使用之前,必须对模型的预测能力进行评估,即对模型进行验证和检验。
在对模型进行检验时,经常采用的方法是“保留样本法”,也就是在建立个人信用评分模型时,将样本随机地分成两部分:一部分用于建立模型,另一部分(称为所谓“保留样本”)用来对模型进行检验。如果模型对建模样本和保留样本的预测结果都较好,说明模型总体来说是稳定的,有一定的应用价值。
对个人信用评分模型进行检验的统计方法很多,常用的统计量包括Gini系统、Kolo-mogoov-Sminov统计量(简称K-S统计量)、和谐度等。
对模型进行评价的总体想法是个人信用评分模型必须尽可能地将高风险授信和低风险授信区别开来。另外,针对某个总体建立起来的个人信用评分模型对该总体的一个子集的预测能力,也是检验模型有效性的一个重要方面。
5.选择临界分值及人工修正
在个人信用评分模型开始运行之前,还需要考虑授信机构所能承受的信用风险的大小。模型本身可以预测某个信用申请人违约的可能性大小,但是并不能确定模型使用者所能承受的总体信用风险的大小。信用申请人的这种承受信用风险的能力取决于授信机构对可能的申请人数量的市场分析、充足资本率要求以及定价、收益目标等因素。
确定授信机构所能承受的信用风险即需要确定信用评分卡的临界值,若申请人的信用评分分值在这一临界值之下,则授信机构可以拒绝其申请;若申请人的信用评分分值高于这一临界值,则建议批准其信用申请。
通常,临界分值的确定应该使得信用申请批准比率基本与当前的批准比率保持一致,或“坏账率”与当前的“坏账率”相等。在个人信用评分模型运行之前,还需要确定“人工修正”原则。“人工修正”是指授信部门作出的决策与个人信用评分模型所建议的不一致时所采取的人工修正规则。
6.个人信用评分模型的监测
由于个人信用评分的基本假设之一是未来与现在是相似的,因此一旦信用评分模型投人运行,技术人员就应与先前的系统相比较,评价新模型的运行效果。这样就需要对模型进行监测,通过监测,能够回答如下的一些重要问题:
(1)信用评分卡的使用是如所预期的那样吗?对信用评分卡的人工修正是否保持在一个尽可能低的水平?人工修正有确实的理由吗?最普遍的理由是哪些?
(2)信用评分卡对贷款风险的排序是否与所期望的一致,或者信用评分卡的表现是否出现退化?好、坏客户发生比(或坏客户比率)与我们运行信用评分卡时的预期是否一致?
(3)信用申请人的特征是否发生了变化?是否有更多分值低的消费者申请贷款但是被拒绝了?他们的特征是什么?
(4)账户的信用分值的分布是否发生了变化?
扫描二维码,即可报名
阅读原文,即可报名
更多精彩,戳这里: